Specifiche HTML 4.0/Introduzione a HTML 4.0
Gli URI consistono tipicamente di tre parti:
Gli URI relativi sono risolti in URI completi utilizzando un URI di base. Come esempio di risoluzione di un URI relativo, si supponga di avere l'URI di base "http://www.acme.com/support/intro.html". L'URI relativo nella seguente marcatura per un collegamento ipertestuale:
In HTML, gli URI sono usati per:
HTML dĂ agli autori i mezzi per:
L'HTML 2.0 (Novembre 1995, si veda RFC1866) č stato sviluppato sotto l'egida della Internet Engineering Task Force (IETF) per codificare quanto era entrato a far parte dell'uso comune alla fine del 1994. L'HTML+ (1993) e l'HTML 3.0 (1995, si veda [HTML30]) hanno proposto versioni molto piů ricche dell'HTML. Nonostante non abbiano mai ricevuto consensi in sede di discussioni sugli standard, questi progetti hanno portato all'adozione di una serie di nuove caratteristiche. Gli sforzi dell'HTML Working Group del World Wide Web Consortium per codificare quanto era entrato a far parte dell'uso comune nel 1996, hanno portato all'HTML 3.2 (Gennaio 1997, si veda HTML32). I cambiamenti occorsi dalla versione HTML 3.2 sono riassunti nell'Appendice A.
Ă opinione comune che i documenti HTML dovrebbero funzionare bene con interpreti e piattaforme differenti. Raggiungere l'interoperabilitĂ abbassa i costi per i fornitori di contenuto dal momento che essi devono sviluppare una sola versione di un documento. Se lo sforzo non venisse fatto, ci sarebbe un rischio molto piů grande che il Web possa cadere in un mondo proprietario di formati incompatibili, riducendo in definitiva il potenziale commerciale del Web per tutti i partecipanti.
Ogni versione dell'HTML ha tentato di riflettere un sempre maggiore consenso tra i partecipanti dell'industria, in modo che gli investimenti fatti dai content provider non vadano sprecati e che i loro documenti non diventino illegibili in un breve intervallo di tempo.
L'HTML č stato sviluppato con in mente l'idea che tutti i tipi di dispositivi dovrebbero esser capaci di usare l'informazione presente sul Web: PC con schermi grafici a differente risoluzione e differente numero di colori, telefoni cellulari, dispositivi palmari, dispositivi con interfaccia vocale, computer ad alta o bassa banda di trasmissione, e cosĂŹ via.
Un importante passo č stato l'adozione dello standard ISO/IEC:10646 (si veda ISO10646) come insieme di caratteri del documento per l'HTML. Si tratta dello standard piů comprensivo a livello mondiale che si occupa di questioni di rappresentazione dei caratteri internazionali, direzione del testo, punteggiatura, ed altri aspetti delle lingue naturali in uso nel mondo.
L'HTML ora offre maggiore supporto per lingue differenti dentro un documento. Questo permette una piů efficace indicizzazione dei documenti per i motori di ricerca, una superiore qualitĂ tipografica, una migliore conversione da testo a parlato, una migliore suddivisione delle parole in sillabe per il ritorno a capo, ecc.
Le informazioni di stile possono essere specificate per singoli elementi o gruppi di elementi. Le informazioni di stile possono essere specificate in un documento HTML o in un foglio di stile esterno.
Il meccanismo per associare un foglio di stile ad un documento č indipendente dal linguaggio del foglio di stile.
Prima dell'avvento dei fogli di stile, gli autori avevano un controllo limitato sulla riproduzione. L'HTML 3.2 conteneva un insieme di attributi e di elementi che permettevano il controllo sull'allineamento, la dimensione dei caratteri e il colore del testo. Gli autori utilizzavano anche tabelle e immagini come mezzo per la disposizione interna delle pagine. Il tempo relativamente lungo che gli utenti impiegano per aggiornare i loro interpreti significa che queste caratteristiche continueranno ad essere utilizzate per qualche tempo. Comunque, dato che i fogli di stile offrono un meccanismo di presentazione piů potente, il World Wide Web Consortium alla fine eliminerĂ molti degli elementi e degli attributi di presentazione di HTML. Da un capo all'altro di queste Specifiche, gli elementi e gli attributi a rischio sono marcati come "disapprovati". Essi sono accompagnati da esempi su come ottenere gli stessi effetti tramite altri elementi o fogli di stile.
I meccanismi forniti per includere script in un documento HTML sono indipendenti dal linguaggio di scripting.
2.1 Che cos'č il World Wide Web?
Il World Wide Web (Web) č una rete di risorse di informazioni. Il Web si basa su tre meccanismi per rendere queste risorse prontamente disponibili al piů vasto insieme possibile di utenti:
Le connessioni tra i tre meccanismi risultano evidenti dal principio alla fine di questa specifica. 2.1.1 Introduzione agli URI
Ogni risorsa disponibile sul Web -- documento HTML, immagine, sequenza video, programma, ecc. -- ha un indirizzo che può essere codificato da un Universal Resource Identifier, o "URI".
Si consideri l'URI che indica le Specifiche HTML correnti: http://www.w3.org/TR/REC-html40
Questo URI può essere interpretato come segue: c'č un documento ottenibile tramite il protocollo HTTP (si veda RFC2068), residente sulla macchina www.w3.org, accessibile tramite il percorso "/TR/REC-html40/". Altri schemi che si possono trovare in documenti HTML includono "mailto" per la posta elettronica e "ftp" per FTP.
Ecco un altro esempio di URI. Questo si riferisce a una casella di posta elettronica di un utente: Per qualsiasi commento, inviare un email a
Joe Cool.
2.1.2 Identificatori di frammento
Alcuni URI si riferiscono ad una posizione dentro una risorsa. Questo tipo di URI termina con un simbolo "#" seguito da un'identificatore di ancora (chiamato l'identificatore di frammento). Ad esempio, ecco un URI che punta ad un'ancora denominata sezione_2: http://somesite.com/html/top.html#sezione_2
2.1.3 URI relativi
Un URI relativo non contiene alcuna informazione sullo schema di denominazione. Il suo percorso si riferisce genericamente ad una risorsa sulla stessa macchina che ospita il documento corrente. Gli URI relativi possono contenere componenti di percorso relativo (ad es., ".." significa un livello piů in alto nella gerarchia definita dal percorso), e possono contenere identificatori di frammento. Suppliers
si espandererebbe nell'URI completo "http://www.acme.com/support/suppliers.html", mentre l'URI relativo nella seguente marcatura per un'immagine
si espanderebbe nell'URI completo "http://www.acme.com/icons/logo.gif".
Si consulti la sezione sul tipo URI per maggiori informazioni sugli URI. 2.2 Che cosa č l'HTML?
Per pubblicare informazioni destinate ad una distribuzione globale č necessario un linguaggio riconosciuto universalmente, una sorta di madre lingua editoriale che tutti i computer possano potenzialmente capire. Il linguaggio di pubblicazione usato dal World Wide Web č l'HTML (da HyperText Markup Language). 2.2.1 Breve storia dell'HTML
L'HTML č stato originariamente sviluppato da Tim Berners-Lee durante la sua permanenza al CERN, ed č diventato popolare grazie all'interprete Mosaic sviluppato dalla NCSA. Nel corso degli anni '90 č prosperato con la crescita esplosiva del Web. Durante questo periodo l'HTML č stato esteso in diversi modi. Il Web dipende dalla condivisione da parte di autori e di rivenditori di pagine Web delle stesse convenzioni per l'HTML. Questo ha motivato uno sforzo congiunto sulle specifiche per l'HTML. 2.3 HTML 4.0
L'HTML 4.0 estende l'HTML con meccanismi per fogli di stile, scripting, frame, incorporamento di oggetti, supporto migliorato per testo da destra a sinistra e a direzione mista, tabelle piů ricche, e ampliamenti dei moduli, offrendo migliore accessibilitĂ per persone affette da disabilitĂ . 2.3.1 Internazionalizzazione
Questa versione dell'HTML č stata progettata con l'aiuto di esperti nel campo dell'internazionalizzazione, cosĂŹ che i documenti possono essere scritti in tutte le lingue ed essere facilmente trasportati in tutto il mondo. Questo č stato possibile incorporando RFC2070, che si occupa dell'internazionalizzazione dell'HTML. 2.3.2 AccessibilitĂ
Con la crescita della comunitĂ Web, e la diversificazione delle capacitĂ e delle competenze dei suoi membri, č cruciale che le tecnologie sottostanti siano appropriate alle relative necessitĂ . L'HTML č stato progettato per rendere le pagine Web piů accessibili a coloro che sono affetti da limitazioni fisiche. Gli sviluppi dell'HTML 4.0 ispirati da riguardi per l'accessibilitĂ includono:
Gli autori che progettano pagine tenendo presente questioni di accessibilitĂ acquisiranno non solo i vantaggi della comunitĂ legata all'accessibilitĂ , ma saranno beneficiati anche in altri modi: i documenti HTML ben progettati che distinguono tra struttura e presentazione si adatteranno piů facilmente a nuove tecnologie. 2.3.3 Tabelle
Il nuovo modello di tabella HTML č basato su RFC1942. Gli autori ora hanno un maggior controllo su struttura e disposizione (ad es., i raggruppamenti di colonne). La possibilitĂ dei progettisti di raccomandare le ampiezze di colonna permette agli interpreti HTML di mostrare i dati di tabella in modo incrementale (via via che arrivano) piuttosto che attendere l'intera tabella prima di riprodurla. 2.3.4 Documenti composti
L'HTML ora offre un meccanismo standard per incorporare oggetti media ed applicazioni generici nei documenti HTML. L'elemento OBJECT (assieme con i suoi antenati piů specifici IMG e APPLET) fornisce un meccanismo per includere immagini, video, suoni, formule matematiche, applicazioni specializzate, ed altri oggetti in un documento. Inoltre, permette agli autori di specificare una gerarchia di riproduzioni alternative per quegli interpreti HTML che non supportano una specifica riproduzione.2.3.5 Fogli di stile
I fogli di stile semplificano la marcatura HTML e sollevano largamente HTML dalle responsabilitĂ della presentazione. Essi forniscono sia agli autori che agli utenti il controllo sulla presentazione dei documenti -- informazioni sui caratteri, allineamento, colori, ecc. 2.3.6 Scripting
Attraverso gli script, gli autori possono creare pagine Web dinamiche (ad es., "moduli intelligenti" che reagiscono mentre l'utente li compila) e usare HTML come mezzo per costruire applicazioni di rete. 2.3.7 Stampa
A volte gli autori vorranno facilitare gli utenti che desiderano stampare piů che il semplice documento corrente. Quando i documenti fanno parte di un lavoro piů grande, le relazioni tra essi possono essere descritte usando l'elemento HTML LINK o usando il Resource Description Language del W3C (RDF) (si veda RDF).2.4 Creazione di documenti con HTML 4.0
Si raccomanda agli autori e agli implementatori di osservare i seguenti principi generali nell'utilizzo di HTML 4.0. 2.4.1 Separare la struttura dalla presentazione
L'HTML ha le sue radici nell'SGML che č sempre stato un linguaggio per la specifica di marcature strutturali. Con la maturazione di HTML, si sta sostituendo un numero crescente dei suoi elementi ed attributi di presentazione con altri meccanismi, in particolare i fogli di stile. L'esperienza ha dimostrato che separare la struttura di un documento dai suoi aspetti di presentazione riduce il costo del servire un'ampia gamma di piattaforme, media, ecc., e facilita le revisioni dei documenti.